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摘要 近年 来 ， 人 工 智 能 (AD 在 前 沿 科 技 领域 取得 了 诸如 AlphaFold2、 核 聚变 智能 控制 、 新 冠 药物 设计 等 
诸多 令 人 瞩目 成 果 ， 表 明 AIfor Science 正在 成 为 一 种 新 的 研究 范式 。 实 现 智能 时 代 的 基础 科学 源头 创新 及 其 
下 游 重 大 技术 创新 ， 需 破解 2 个 方面 的 核心 问题 : (1) 如 何 利 用 新 一 代 AI (特别 是 生成 式 AI 及 大 模型 ) 的 通 
用 性 和 创造 性 推动 新 范式 的 形成 ; (2) 如 何 利用 AI 实现 对 传统 科学 设施 的 赋 能 与 改造 。 文 章 提 出 一 种 智能 化 
科学 设施 的 建设 构想 ， 兼 顾 “ 高 度 智 能 化 的 科学 新 设施 ”和 “AI 赋 能 已 有 科学 大 设施 ”2 个 层面 的 需求 ， 构 
SAI for Science 的 科学 设施 体系 ， 形 成 科学 领域 大 模型 、 生 成 式 模拟 与 反 演 、 自 主 智 能 无 人 实验 及 大 规模 可 
信 科 研 协作 等 创新 功能 ， 加 速 重 大 科学 发 现 、 变 革 性 物质 合成 ， 以 及 重大 工程 技术 应 用 。 


天 键 词 ”人工 智能 驱动 科学 研究 ， 生 成 式 人 工 智能 ， 语 言 大 模型 ， 科 学 设施 
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1 科学 研究 新 范式 :Al for Science (科学 经 取得 了 令 人 瞩目 的 重大 成 果 。 在 生物 领域 ，2021 年 
us 《科学 》 杂 志 将 AlphaFold2 评选 为 “2021 年 度 十 大 科 
学 突破 ”榜首 趾 ， 在 物质 领域 , AI 实现 了 核 聚 变 托 卡 
1.1 科学 研究 范式 的 演进 马克 装置 的 等 离子 流 高 效 控制 外， 在 药物 领域 ,AI 加 
人 工 智能 CAD 在 前 沿 科学 与 技术 领域 的 应 用 已 。” 速 了 新 冠 药 物 设计 中。 众多 的 科学 突破 和 国内 外 的 发 
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展 趋势 表明 AI for Science 正在 成 为 一 种 新 的 研究 
范式 。 

2007 年 ， 图 灵 奖 得 主 Jim Gary 曾经 用 “4 种 范式 ” 
描述 了 科学 发 现 的 历史 演变 ， 即 实验 观察 、 理 论 推 
导 、 模 拟 仿 真 、 数 据 驱 动 ( 即 数据 密集 型 科学 发 现 ) 
(图 1)。 几 千年 前 ， 人 类 通过 实验 观察 和 经 验 来 描述 
自然 现象 ， 形 成 经 验 范式 (第 一 范式 )。 几 百年 前 ， 
科学 家 开始 使 用 理论 推导 进行 科学 研究 ， 基 于 理论 和 
模型 解释 自然 现象 ， 如 17 世 纪 和 牛顿 定律 的 诞生 ， 这 是 
理论 范式 〈 第 二 范式 )。20 世 纪 中 叶 以 来 ， 科 学 家 通 
过 计算 机 模拟 仿真 复杂 现象 ， 进 行 理 论 验证 ， 形 成 了 
计算 范式 (第 三 范式 )。 近 10 多 年 来 ， 人 类 进入 大 数 
据 时 代 ， 通 过 大 数据 分 析 去 理解 、 逼 近 复 杂 系 统 ， 得 
出 之 前 未 知 的 科学 理论 ， 形 成 了 数据 密集 型 范式 (第 
四 范式 )。 然 而 ， 由 于 受 限于 数据 采集 与 模拟 空间 ， 
即便 在 数据 密集 型 的 科学 研究 范式 下 ， 科 学 假设 依旧 
由 科学 家 的 专家 经 验 主导 ; 同时 由 于 缺乏 有 效 的 数据 
开放 机 制 和 实验 的 局 域 性 ， 制 约 了 大 规模 、 跨 学 科 科 
研 活动 的 开展 。 

最 近 若 十 年 ， 深 度 学 习 技术 ， 特 别 是 生成 式 AI 的 
迅猛 发 展 ， 使 得 学 术 界 可 以 利用 深度 学 习 建 模 和 挖掘 
高 维 科研 数据 ， 捕 捉 多 模 态 数据 背后 的 科学 规律 ， 同 
时 借助 数据 生成 的 方式 ， 突 破 实验 观测 数据 的 有 限 性 
与 数值 模拟 的 理论 限制 ， 拓 展 科学 假设 的 空间 。 多 模 


态 语言 大 模型 潜在 的 文献 理解 总 结 、 实 验方 案 生 成 等 
全 新 能 力 ， 结 合 无 人 实验 系统 与 科学 数据 开放 平台 ， 
可 促使 科学 研究 迈 向 以 “平台 协作 ”为 主要 特征 的 新 
模式 。 微 软 剑桥 研究 院 院 长 Chris Bishop 等 将 AI for 
Science 称 为 驱动 科学 研究 的 第 五 范式 (利用 AI 和 机 
器 猜想 来 进行 科学 发 现 的 新 方法 ) Us 与 前 4 种 范式 不 
同 ， 它 不 仅 依赖 于 已 有 数据 和 方程 ， 而 且 能 够 通过 机 
需 学 习 模拟 自然 现象 ， 推 断 出 某 些 未 知 的 规律 ， 提 高 
科学 研究 的 效率 和 准确 性 ， 探 索 更 广阔 的 可 能 性 空 
间 ， 其 中 包括 问题 空间 和 解 空 间 。 
1.2 国内 外 对 Al for Science 的 激励 措施 与 计划 
鉴于 AI 可 能 为 科学 发 展 带 来 的 巨大 助力 ， 英 国 提 
出 “用 于 科学 研究 和 政府 管理 的 人 工 智能 ”(AI for 
Science and Government) 计划 ， 虽 在 应 用 AI 解决 现实 
自然 /社会 科学 问题 。 美 国 国家 科学 基金 会 (NSF) 于 
2021 年 开展 了 一 项 Al4Science 研 究 计 划 ， 使 用 AI 推动 
数学 和 物理 学 领域 科学 发 现 。2022 年， 法 国 国家 科学 
研究 中 心 (CNRS) 成 立 “ 人 工 智 能 与 科学 研究 双向 
驱动 的 跨 学 科 中 心 ” (The Artificial Intelligence for 


hi 


Science, Science for Artificial Intelligence Center, 
AISSAI)， 推 动 不 同 领域 间 的 交流 与 合作 ， 拓 展 AI 在 
科学 研究 中 的 应 用 。 从 2019 年 起 ， 中 国 科 学 院 及 其 所 
属 研究 院 所 在 多 个 学 科 领 域 开 展 了 AI for Science 相关 
研究 ， 涵 盖 生 物 医学 、 材 料 科 学 、 计 算 物 理 及 量子 计 


1 经 验 ( 几 千 年 前 ) 2 理论 〈 几 百年 前 ) 3 计算 〈 几 十 年 前 ) 4 数据 (十 几 年 前 ) 
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图 1 科学 研究 范式 的 转变 


Figure 1 Paradigm shift in Scientific research 


(D Chris Bishop. 科学 智能 (AI4Science) 赋 能 科学 发 现 的 第 五 范式 . (2022-07-07). https://www.msra.cn/zh-cn/news/features/ai4sci- 
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算 等 多 个 领域 。 

2017 年 ， 国 务 院 在 印发 的 《新 一 代 人 工 智 能 发 展 
规划 》 中 指出 :“ 聚 焦 人 工 智能 重大 科学 前 沿 问 题 ， 
兼顾 当前 需求 与 长 远 发 展 ， 以 突破 人 工 智 能 应 用 基础 
理论 瓶颈 为 重点 ， 超 前 布局 可 能 引发 人 工 智能 范式 变 
革 的 基础 研究 ， 促 进 学 科 交叉 融合 ， 为 人 工 智能 持续 
发 展 与 深度 应 用 提供 强大 科学 储备 "。2023 年 3 月 ， 科 
学 技术 部 会 同 国家 自然 科学 基金 委 启动 “人 工 智 能 驱 
动 的 科学 研究 ”专项 部 署 工作 ， 推 进 面向 重大 科学 问 
题 的 AI 模型 和 算法 创新 ， 发 展 针 对 典型 科研 领域 的 
AI for Science 专用 平台 ， 布 局 AI for Science 研发 体 
系 ， 逐 步 构建 以 AI 支撑 基础 和 前 沿 科 学 研究 的 新 模 
式 ， 加 速 我 国 科研 范式 变革 和 能 力 提升 。 


2 智能 化 科学 设施 


虽然 AI 在 特定 科学 领域 的 应 用 已 经 取得 了 令 人 有 瞩 
目的 重大 成 果 ， 如 AlphaFold20、 核 聚变 智能 控制 叫 、 
基于 AI 规划 的 全 自动 有 机 合成 平台 握 、 分 子 动力 学 模 
拟 中 及 新 冠 药物 设计 中、 生成 式 材料 反 向 设计 中 等 ， 但 
是 这 些 工 作 仍然 处 于 特定 研究 组 对 特定 问题 的 科研 模 
式 ， 学 科 的 跨度 、 研 究 场景 的 规模 、 研 究 方案 及 其 结 
果 的 可 复 现 性 均 受 到 限制 ,“ 平 台 协作 式 ” 的 AI for 
Science 科研 模式 及 设施 体系 尚 有 待 建立 。 

实现 智能 时 代 的 基础 科学 源头 创新 及 其 下 游 重 大 
技术 创新 ， 和 急需 破解 2 个 核心 问题 。G 如 何 面向 AI 
for Science 的 研究 范式 ， 建 立 全 新 的 科学 智能 大 设施 ? 
从 而 系统 性 、 整 体 性 地 释放 新 一 代 AI (特别 是 生成 式 
AI 及 大 模型 ) 在 基础 科学 领域 的 创造 性 和 通用 性 ， 实 
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传统 的 科学 设施 和 研究 范式 下 ， 整 个 科研 流程 存在 科 
学 问题 沟通 难 、 科 学 实验 操作 难 、 科 学 数据 共享 难 等 
困难 (图 2)。 一 些 高 精 尖 的 大 型 科学 设施 及 其 科研 环 
境 高 度 复 杂 ， 此 类 困难 尤为 突出 。 利 用 新 一 代 AI 实 现 
“科学 问题 (科学 家 ) 一 实验 设备 (实验 员 ) 一 科研 
数据 及 文献 (科研 机 构 及 中 介 ) ”高 效 闭 环 ， 不 仅 是 
新 建 的 科学 设施 需要 具备 的 标 配 ， 更 是 在 已 有 的 科学 
设施 升级 改造 过 程 中 的 新 需求 和 新 机 遇 。 

针对 上 述 问题 ，2023 年 4 月 ， 上 海 交 通 大 学 人 工 
智能 研究 院 团 队 在 浦江 创新 论坛 “AI for Science 专题 
论坛 ”上 提出 了 建设 “智能 化 科学 设施 ”(AI enabled 
Scientific Facility, AISF) 的 构想 。 智 能 化 科学 设施 的 
总 体 思路 是 瞄准 世界 科技 前 沿 与 国家 重大 需求 ， 兼 顾 
“创建 高 度 智能 化 的 科学 新 设施 ”和 “ 赋 能 已 有 科学 
大 设施 ”2 个 层面 ， 构 筑 AI for Science 的 科学 设施 体 
系 ， 加 速 重 大 科学 发 现 、 变 革 性 物质 合成 及 重大 工程 
技术 应 用 (图 2)。 

智能 化 科学 设施 综合 运用 生成 式 AL, ROCKS 
型 、 大 数据 、 区 块 链 等 前 沿 技术 ， 形 成 人 在 环 路 的 科 
学 智能 大 设施 3 层 体系 架构 (图 3)。@ 基础 支撑 层 ， 
通过 高 性 能 计算 、 算 力 网 ， 形 成 算 力 支撑 ; @ 科学 模 
层 ， 构 建 跨 学 科 、 跨 模 态 的 科学 大 模型 ， 以 及 “AI 
人 研 助 手 ”; © 实验 应 用 层 ， 通 过 AI 操作 机 器 人 、 智 
能 实验 环境 ， 实 现 自主 无 人 实验 和 多 方 科研 协作 。 

在 3 层 架 构 基 础 上 ， 智 能 化 科学 设施 可 形成 传统 
范式 所 不 具备 的 4 个 主要 新 功能 (图 4): GD 科学 大 模 
型 ， 实 现 跨 模 态 的 科研 内 容 生成 、 文 献 综述 生成 、 科 
学 任务 自动 拆 解 及 实验 方案 自动 生成 等 能 力 ， 进 而 构 


Des 


3 


现 自发 假设 生成 、 自 动 规律 推演 、 自 主 无 人 实验 、 自 
驱 可 信 协 作 等 创新 功能 ， 推 动 超大 规模 、 高 速 闪 代 的 
科学 探索 ? © 如 何 利 用 新 一 代 AI 实 现 对 传统 科学 设 
施 的 赋 能 ”科学 研究 活动 主要 包括 由 科学 家 提出 问题 
和 假设 、 由 实验 人 员 进 行 检验 和 验证 、 通 过 科研 机 构 
与 出 版 商 进行 科研 成 果 和 数据 传播 与 共享 等 环节 。 在 


造 具有 较 高 综合 科学 能 力 的 “AI 科研 助手 ”系统 模 
型 ; @ 生成 式 模拟 与 反 演 ， 提 供 复 杂 流 体 、 多 物理 
场 、 复 杂 物 质 结构 等 科学 现象 生成 及 其 AI 加 速 的 超大 
规模 模拟 能 力 ， 缓解 维度 灾难 (curse of 
dimensionality) ， 激 发 科学 直觉 ; (8) 高 通 量 自主 无 人 
实验 ， 将 自动 化 实验 室 和 AI 模型 结合 ， 实 现 合成 化 
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超大 规模 、 高 速 和 迭代 的 科学 探索 


支撑 新 范式 = 


面向 第 五 范式 的 


智能 化 科学 设施 (AISF) 
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m ESED 


赋 能 已 有 科学 设施 
传统 实验 的 智能 化 赋 能 与 改 ; 


高 度 智能 化 的 科学 新 设施 


科学 问题 的 加 速 求 解 科学 问题 沟通 难 


e A a a E [- i n1 


科学 数据 的 治理 共享 科学 数据 共享 难 


图 2 智能 化 科学 设施 的 总 体 思 路 


Figure 2 Overall approach of AI enabled scientific infrastructure 


科学 领域 模型 
科学 猜想 - 动力 模拟 直觉 学 习 - 属性 预测 - 结构 生成 因果 推断 : 优化 决策 


跨 学 科 、 跨 模 态 的 科学 大 模型 
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科学 装置 的 Al 赋 能 


Si xn W ut 
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图 3 智能 化 科学 设施 的 架构 设想 
Figure3 Conceptual architecture of AI enabled scientific infrastructure 
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多 模 态 科学 内 容 生 成 、 文 献 综 述 生 成 、 科 学 假设 生成 


生成 式 模拟 与 反 演 
复杂 流体 、 多 物理 场 、 分 子 结构 变化 等 科学 现象 生成 、 规 律 模 拟 与 反 演 


高 通 量 自主 无 人 实验 
可 控 化 学 合成 、 蛋 白质 精准 修饰 、 材 料 基因 组 等 新 机 理 和 
新 方法 的 自主 验证 和 筛选 


高 效 、 可 信 的 大 规模 科研 协作 
科学 模型 和 科学 数据 集 的 链 上 溯源 、 确 权 、 共 享 、 流 通 


可 信 协 作 


图 4 智能 化 科学 设施 的 创新 功能 


Figure 4 Innovative functionalities of AI enabled scientific 


infrastructure 


学 、 合 成 药物 、 材 料 基 因 组 等 领域 的 “ 干 湿 闭 环 ” 自 
主 实验 验证 ; GD 大 规模 可 信 科 研 协作 : 通过 区 块 链 、 
群体 智能 等 技术 ， 实 现 科 学 模型 及 数据 集 的 链 上 逆 
源 、 确 权 、 共 享 、 流 通 ， 加 速 科学 新 思想 和 新 方法 的 
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涌现 。 

在 上 述 架 构 和 功能 基础 上 ， 以 人 类 科学 家 和 科学 
问题 为 中 心 ， 构 筑 “AI 科 研 助 手 一 AI 操 作 机 絮 人 一 乱 
能 实验 环境 一 可 信和 多 方 协作 ”的 人 机 物 协同 科研 空 
间 ， 模 向 支撑 超大 规模 的 “假设 生成 一 规律 推演 一 无 
人 实验 ”高 速 迭代 、 推 进 高 度 智 能 化 的 AT for Science 
科研 范式 转变 ， 纵 向 优化 基础 科学 大 设施 、 赋 能 传统 
“实验 观察 一 理论 建 模 一 数据 分 析 ” 科 研 流程 。 


3 科学 大 模型 


以 ChatGPT 为 代表 的 对 话 式 大 语言 模型 被 视 为 颠 
履 性 的 新 一 代 AI 技 术 。 在 基础 大 语言 模型 之 上 ， 通 过 
科学 大 数据 训练 科学 知识 与 能 力 ， 通 过 “科学 家 在 环 


路 ”的 强化 学 习 实现 科学 规范 伦理 对 齐 ， 打 造 适用 于 
科学 研究 的 大 模型 ， 有 望 形成 AI 与 基础 科学 之 间 交 互 
强化 、 回 旋 加 速 的 创新 机 制 与 方法 体系 。 

(1) AI 正 向 驱动 基础 科学 。 一 方面 ， 利 用 AI 提高 
科学 研究 的 速度 和 准确 性 ， 以 及 对 科学 知识 的 融 汇 能 
力 ， 探 索 更 广阔 的 科学 假设 空间 ， 促 进 多 学 科 深 度 交 
又 和 重大 科学 发 现 。 另 一 方面 ，AI 成 为 传统 科研 范式 
的 有 益 补 充 ， 可 有 效 提 升 实验 观察 、 理 论 推导 、 仿 真 
模拟 、 数 据 驱 动 等 能 力 。 

(2) 基础 科学 反 向 驱动 AI。GD 科学 大 模型 将 为 领 
域 大 模型 的 发 展 树立 技术 标杆 。 在 主要 面向 人 类 自然 
语言 和 常用 编程 语言 的 大 语言 模型 基础 上 ， 科 学 AI 大 
模型 还 要 面向 数学 公式 、 物 理 方程 、 化 学 分 子 式 、 材 
料 结构 、 基 因 序 列 等 跨 学 科 、 跨 模 态 的 科学 语言 和 文 
献 ， 可 以 对 其 他 大 模型 的 发 展 起 到 示范 作用 。(C 相 较 
于 面向 互联 网 应 用 的 基础 大 模型 ， 面 向 特定 领域 的 科 
学 大 模型 拥有 更 快 的 训练 和 迭代 速度 。 同 时 ， 科 学 大 
模型 的 服务 对 象 为 科研 工作 者 和 高 校 学 生 ， 其 使 用 过 
程 中 将 产生 海量 的 科学 问题 及 回答 ， 从 而 积聚 科学 知 
识 、 引 导 大 模型 生成 新 的 科学 假设 。@) 当前 大 模型 备 
受 争 议 的 是 大 数据 、 大 算 力 导 致 的 高 能 耗 。 这 需要 从 
开源 、 节 流 2 个 方面 去 解决 。 从 开源 角度 来 看 ， 需 推 
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图 5 科学 大 模型 整体 架构 图 


Figure 5 Architecture diagram of scientific large-scale models 
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动能 源 科学 技术 的 进步 ， 进 一 步 提 升 人 类 汇集 、 产 
生 、 存 储 、 输 送 、 使 用 能 源 的 效率 ， 这 也 是 AI 可 以 发 
挥 重要 作用 的 领域 。 从 节 流 角度 来 看 ， 需 努力 降低 计 
算 系 统 的 能 耗 ， 追 求 绿色 节能 。 随 着 计算 所 需 的 能 源 
成 本 降低 、AI 计 算 体系 架构 的 逐步 完善 ， 无 论 是 基础 
大 模型 ， 还 是 科学 大 模型 ， 都 将 进一步 释放 出 更 大 的 
威力 。 

为 构建 科学 大 模型 〈 图 5)， 我 们 需要 在 基础 大 语 
言 模型 之 上 形成 4 种 专门 能 力 ， 并 构建 对 应 的 评测 基 
JE. CD 跨 学 科 跨 模 态 统 一 输入 的 能 力 。 语 言 大 模型 
逐渐 被 应 用 到 生物 医学 路 、 材 料 学 和 化 学 外 等 多 个 
学 科 领 域 , 已 经 可 以 较 好 地 实现 实体 识别 、 关 系 抽 
取 、 领 域 分 类 等 文本 处 理 任务 。 在 科学 研究 产生 的 
数据 中 ， 除 了 文本 数据 ， 一 般 还 有 公式 、 图 表 、 分 
子 式 等 多 模仿 数据 ， 如 何 实现 这 些 跨 模 态 数据 的 统 
一 输入 ， 进 而 对 里 学 科 的 专业 知识 进行 联合 建 模 ， 
是 建立 科学 大 模型 吸 待 解决 的 挑战 问题 。@ 有 效 调 
用 外 部 科学 工具 的 能 力 。 大 模型 虽然 拥有 较 强 的 语 
言 理解 、 语 言 生成 及 复杂 推理 能 力 ， 但 仍然 存在 输 
出 看 似 合 理 、 实 则 错误 内 容 的 问题 。 相 比 基 础 大 语 
言 模型 ， 科 学 大 模型 对 生成 内 容 的 专业 性 、 准 确 性 
都 提出 了 更 高 要 求 。 解 决 此 类 问题 的 一 种 可 行 技术 
途径 是 将 大 模型 作为 规划 与 推理 引擎 ， 通 过 调用 不 
同类 型 的 外 部 科学 工具 ， 以 提高 可 信和 度 和 准确 性 。 
(3) 模型 持续 反馈 和 进化 的 能 力 。 人 类 科学 家 可 以 依 
靠 自身 的 经 验 积累 和 外 部 的 持续 反馈 ,不 断 提升 科 
研 能 力 。 类 似 地 ， 科 学 大 模型 一 方面 可 以 利用 科研 
人 员 的 高 质量 反馈 ， 完 善 科学 领域 专业 知识 ， 增 强 
科学 知识 建 模 与 推 凯 能 力 ， 提 高 科学 内 容 生 成 、 文 
献 归 纳 推 理 等 方面 的 水 平 ; 男 一 方面 ， 可 以 利用 实 
验 反 馈 来 不 断 提 升 其 科学 假设 生成 和 实验 方案 优化 
的 能 力 。@@ 幻觉 (hallucination) 消除 能 力 。 目 前 ， 
大 模型 仍然 存在 幻觉 现象 〈 即 模型 生成 的 内 容 与 现 
实 世界 事实 或 用 户 输入 不 一 致 的 现象 ) ， 难 以 满足 
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科学 研究 的 精度 要 求 。 如 何 有 效 筛 选 专家 知识 ， 并 
利用 高 精准 度 的 专业 知识 进行 强化 学 习 ， 实 现 大 模 
型 的 迭代 和 更 新 ， 是 消除 科学 幻觉 的 重要 方法 。 此 
外 ， 基 于 基 座 模型 的 定向 优化 和 集成 ， 在 特定 领域 
提升 模型 的 可 信和 度 和 精准 度 ， 也 是 修正 科学 幻觉 的 
ERR, © 科学 大 模型 的 评测 基准 。 为 了 对 科学 
大 模型 的 能 力 进 行 准确 评 佑 ,并 促进 其 快速 迭代 ， 
蝶 需 在 科学 知识 和 常识 的 基础 上 建立 覆盖 学 科 面 较 
广 的 科学 知识 测试 基准 ， 一 方面 测试 科学 大 模型 的 
跨 模 态 、 跨 学 科 数 据 理解 和 建 模 能 力 ; 另 一 方面 评 
测 科学 大 模型 是 否 具有 利用 科学 工具 准确 和 鲁 棒 地 完 
成 复杂 任务 的 能 力 ， 以 及 是 否 具 有 和 较 强 的 拒绝 生成 
虚假 和 有 害 内 容 的 能 力 。 

综 上 所 述 ， 科 学 大 模型 作为 “AI 助手 ”辅助 人 类 
科学 家 进行 科学 研究 ， 需 要 具备 蜂 学 科 的 知识 背景 、 
处 理 跨 模 态 数据 输入 、 掌 握 外 部 科学 工具 的 调用 能 
力 ， 结 合 反 馈 与 评测 ， 实 现 持 续 进 化 。 另 外 需要 强调 
的 是 ， 科 学 大 模型 作为 人 类 的 “AI 科研 助手 ”提出 
“科学 假设 "， 仅 仅 是 给 人 类 科学 家 的 建议 ， 需 要 认真 
甄别 后 方 可 进行 后 续 的 科学 论证 或 实验 探索 。 


4 生成 式 模拟 与 反 演 


用 仿真 及 计算 机 模拟 工具 实现 “理论 一 现象 ”之 
间 的 推演 是 科学 研究 的 重要 范式 之 一 。 仿 真空 间 从 人 
类 感官 的 直觉 上 建立 了 假设 空间 和 观测 空间 的 桥梁 


假设 空间 


律 的 理论 刻画 


形成 新 的 科学 洞 见 


仿真 空间 


ES 


n— 专题 : 大 力 推进 科研 范式 变革 


(图 6)。 在 核 物 理 等 规律 及 理论 明确 、 数 据 质量 高 、 
观测 成 本 高 的 应 用 场景 中 ， 计 算 机 仿真 越 来 越 多 地 作 
为 实验 的 有 效 补 充 。 然 而 ， 传 统 的 基于 数值 计算 的 模 
拟 方法 在 很 多 现实 场景 中 至 少 存在 求解 速度 与 精度 2 
个 方面 的 局 限 : WW 迭代 计算 速度 慢 ， 特 别 是 大 规模 的 
科学 问题 ， 对 算 力 需求 巨大 ; O 诸多 复杂 科学 现象 的 
底层 理论 模型 尚 不 完备 ， 只 能 采取 近似 或 忽略 复杂 高 
阶 物理 关系 的 方式 进行 模拟 ， 使 得 仿真 可 能 产生 有 悖 
于 实际 观测 的 结 

生成 式 AI 技术 有 望 克服 求解 速度 和 精度 上 的 局 限 
o O 以 生成 式 神经 网 络 为 基础 结构 ， 将 对 复杂 系统 
的 数值 求解 问题 转化 为 数据 拟 合 问题 ， 建 立 起 从 假设 
空间 到 仿真 空间 的 高 效 映射 ， 从 而 加 速 求 解 。@® 利用 
生成 式 泻 染 技术 ,实现 从 仿真 空间 到 观测 空间 的 科学 
现象 表 观 生成 ， 进 而 实现 模 跨 3 个 空间 的 闭环 学 习 ， 
驱动 规律 反 演 (图 6)。 
4.1 从 假设 空间 到 仿真 空间 的 科学 规律 映射 

对 于 理论 模型 相对 完备 的 科学 现象 ， 生 成 式 AI 求 
解 方法 可 以 形成 假设 空间 到 仿真 空间 的 映射 ， 加 速 方 
程 求解 。 关 键 技术 难题 在 于 如 何 将 理论 模型 尽 可 能 准 
确 、 有 效 地 伦 入 到 机 器 学 习 求解 句 的 神经 网 络 训练 过 
程 中 。 一 种 方法 是 用 传统 数值 模拟 器 产生 的 仿真 数据 
训练 神经 网 络 ， 间 接 实 现 科 学 规律 误 和 巴 。 另 一 种 更 
为 直接 的 方式 是 将 数学 方程 转化 为 神经 网 络 的 损失 函 
数 ， 从 而 利用 科学 先 验 使 得 机 天 学 习 求解 过 程 快 速 收 


观测 空间 


图 6 仿真 空间 的 生成 式 模拟 与 反 演 


Figure 6 Generative AI based simulation and inversion 
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敛 到 理论 解 附近 5。 然 而 ， 上 述 生 成 式 AI 求 解 方法 在 
训练 数据 层面 严重 依赖 数值 模拟 器 的 精度 ， 对 理论 模 
型 尚 不 完备 的 复杂 科学 现象 ， 往往 存 在 训练 数据 与 真 
实数 据 存在 偏差 .边界 条 件 与 方程 假设 过 度 化 简 等 系 
统 性 差异 ， 在 此 基础 上 训练 的 机 需 学 习 求解 器 ， 不 可 
避免 地 存在 误差 累积 的 问题 。 
4.2 “假设 一 仿真 一 观测 ”三 空间 的 闭环 学 习 

针对 理论 模型 尚 有 待 完 善 的 复杂 科学 现象 ， 生 成 
式 AI 技 术 还 可 以 被 用 来 学 习 仿真 空间 到 观测 空间 的 数 
据 映 射 关 系 5， 有 能 力 生 成 在 统计 学 意义 上 符合 观测 
分 布 、 在 感官 上 更 逼近 现实 的 信号 与 信息 ， 从 而 允许 
科学 家 根据 实际 观测 数据 反 演 仿真 空间 中 的 状态 “后 
验 信息 ”， 通 过 与 仿真 得 到 的 “ 先 验 信息 ”进行 比 对 ， 
对 已 有 的 科学 规律 进行 修正 ， 其 至 通过 拓展 假设 空 
间 ， 发 现 新 的 科学 现象 。 

目前 ， 生 成 式 AI 技 术 已 被 广泛 验证 可 以 极 大 地 加 
速 超 大 规模 科学 计算 问题 的 求解 ， 缓 解 维度 灾难 。 以 
流体 模拟 为 例 (图 6),“ 神 经 流体 ”(NeuroFluid) '?! 
提出 的 生成 式 AI 技 术 的 反 演 方法 ， 以 机 器 学 习 求解 器 
的 流体 粒子 仿真 结果 驱动 基于 “神经 辐射 场 ”(NeRF) 
的 图 形 泻 染 ， 将 数据 中 隐藏 的 物理 规律 从 观测 空间 映 
射 回 容易 被 科学 家 理解 分 析 、 可 以 用 状态 参数 调控 的 
仿真 空间 ， 实 现 从 自然 图 像 中 高 精度 地 推理 复杂 几何 
结构 周围 的 流体 运动 。 但 生成 式 AI 技 术 的 可 解释 性 与 
鲁 棒 性 还 缺乏 足够 的 理论 保障 。 未 来 需要 重点 突破 复 
杂 流 体 、 多 物理 场 、 复 杂 物 质 结构 等 科学 规律 谱 和 人 到 
机 需 学习 求 解 器 的 问题 ， 以 及 探索 如 何 进一步 利用 生 
成 式 AI 技术 进行 “假设 一 仿真 一 观测 ”3 个 空间 之 间 
的 推理 ， 尤 其 是 针对 理论 模型 仍 不 完备 的 科学 问题 ， 
激发 科学 直觉 ， 实 现 理论 模型 的 完善 或 者 修正 。 


5 自主 智能 无 人 实验 系统 


自主 智能 无 人 实验 系统 中 在 将 AI 和 机 器 人 领域 的 
合 


技术 成 果 与 科学 实验 进行 结合 ， 通 过 无 人 化 、 标 准 


Alfor Science: 智能 化 科学 设施 变革 基础 研究 


化 、 大 规模 的 实验 流程 ， 提 升 实验 效率 和 可 复 用 性 。 
美国 麻 省 理工 学 院 (MIT). 的 Coley 等 内 于 2018 年 提 
出 AI 规划 的 自动 化 学 合成 工作 流 ， 中 国 科学 技术 大 
学 江 俊 团队 外 于 2023 年 提出 基于 文献 阅读 的 机 器 人 自 
动 合成 装置 。 在 此 基础 之 上 ， 智 能 化 科学 设施 强调 形 
成 “开放 协作 、 人 在 环 中 ”的 人 一 机 融合 实验 模式 
(图 7)。 其 中 ,无 人 实验 操作 平台 及 智能 化 系统 的 任 
务 流程 主要 包括 3 个 步骤 : O 方案 自动 优化 ， 在 所 提 
出 科学 猜想 的 基础 上 ， 自 主 进行 模型 设计 和 方案 优 
化 ; © 自主 任务 规划 ， 整 合 科学 大 模型 ， 将 实验 和 反 
应 流程 转化 为 形式 化 的 机 器 人 操作 指令 ， 完 成 实验 操 
作 的 全 流程 自主 规划 ; @ 无 人 实验 操作 ， 基 于 机 器 人 
的 无 人 实验 操作 平台 执行 操作 指令 ， 开 展 自主 无 人 实 
验 ， 研 究 人 员 可 通过 人 机 交互 接口 远程 监控 实验 状 
态 。 在 无 人 实验 操作 平台 及 智能 化 系统 的 基础 上 ， 扩 
展 形成 安 人 全、 并行、 协作 的 大 规模 开放 实验 平台 。 
5.1 无 人 实验 的 操作 平台 

根据 操作 精度 的 不 同 ， 无 人 实验 操作 可 分 为 微观 
和 宏观 2 种 空间 尺度 。 微 观 尺 度 下 的 无 人 实验 的 操作 
对 象 通常 为 活 细胞 、 蛋 白质 等 微小 颗粒 ， 多 采用 固定 
实验 平台 ， 其 核心 问题 为 提升 高 精度 操作 通 量 。 宏 观 
尺度 的 无 人 实验 操作 侧重 实验 流程 的 完备 性 ， 以 搭载 
机 械 臂 的 可 移动 机 器 人 为 主 在 实验 设备 之 间 自 主 移 


安全 控制 | ; 


大 规模 并 行 F4 f * | 


开放 协作 | ; 


大 规模 开放 实验 平台 


无 人 实验 智能 化 系统 


图 7 自主 智能 无 人 实验 系统 


Figure 7 Autonomous unmanned experiment system 
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动 ， 完 成 多 任务 全 流程 的 自动 化 实验 。 此 外 ， 人 形 机 
器 人 能 够 在 人 一 机 融合 协作 环境 中 以 更 直接 的 方式 实 
现 高 精度 灵巧 操作 技能 的 模仿 学 习 ， 有 望 进一步 提升 
无 人 实验 操作 平台 机 需 人 的 灵活 性 和 自主 性 。 

5.2 无 人 实验 的 智能 化 系统 

在 硬件 本 体 平 台 的 基础 上 ， 构 建 智能 化 系统 软件 
是 自主 智能 无 人 实验 平台 的 男 一 个 基础 问题 ， 通 过 软 
件 驱 动 自身 状态 感知 、 外 部 环境 感知 、 移 动 导航 、 仪 
器 定位 、 实 验 操 作 规划 和 控制 执行 等 流程 。 深 度 强化 
学 习 与 模仿 学 习 可 以 通过 环境 交互 的 经 验 轨 迹 或 专家 
示 教 轨迹 进行 自主 学 习 ， 构 建 观测 信息 与 最 优 动 作 之 
间 的 映射 关系 请 。 近 年 来 ，ChatGPT 等 语言 大 模型 为 
无 人 实验 智能 化 系统 的 设计 带 来 新 的 技术 途径 ， 一 方 
面 可 以 将 语言 指令 和 外 界 观测 序列 以 端 到 端的 方式 映 
射 为 机 如 人 动作 指令 ; 男 一 方面 可 以 接收 并 理解 人 类 
输入 的 语言 指令 ， 自 动 将 任务 分 解 为 若干 个 易于 完成 
的 子 任务 。 

5.3 多 机 协作 的 开放 实验 平台 

目前 ， 硬 件 平台 的 集成 和 智能 化 系统 的 相关 技术 
已 经 可 以 初步 实现 个 体 实 验 平台 的 无 人 化 和 自主 化 。 
未 来 的 发 展 方向 是 多 机 协作 开放 实验 平台 的 构建 ， 为 
此 需要 重点 关注 4 个 问题 。 

(1) 多 机 并 行 。 当 前 的 自动 化 实验 方法 大 多 使 用 
单个 机 械 臂 或 单 体 移 动机 器 人 ， 缺 乏 长 序列 任务 的 调 
度 能 力 ， 实 验 吞 吐 量 较 低 。 多 机 平台 采用 并 行 化 工作 
流程 和 多 机 协作 调度 ， 引 入 标准 化 的 批量 实验 操作 、 
数据 处 理 流程 、 灾 备 元 余 预 案 ， 提 高 工作 效率 ， 降 低 
实验 的 不 确定 性 ， 实 现实 验 的 可 控 性 、 资 源 配 置 的 最 
优化 及 灵活 性 。 

(2) 开放 协作 。 当 无 人 实验 平台 无 法 自主 完成 复 
杂 的 未 见 的 实验 任务 时 ， 研 究 人 员 可 通过 手动 引导 的 
方式 跟 机 融 人 协作 完成 安 动 一 微 动 实验 操作 ， 形 成 
“开放 协作 、 人 在 环 路 ”的 人 一 机 融合 实验 模式 。 

(3) 实验 结果 评价 。 依 据 特定 科学 领域 ， 设 计 合 
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理 的 无 人 实验 成 效 评价 机 制 ， 主 要 包括 : (D 科学 实验 
本 身 的 成 功率 ， 即 与 人 工 实验 结果 的 一 致 性 ; ( 实验 
操作 是 否 达 到 应 有 的 标准 (如 操作 和 定位 精度 ); © 并 
行 协作 平台 的 实验 过 程 的 通 量 水 平和 工作 效率 。 

(4) 安全 保障 。 大 规模 开放 无 人 实验 平台 的 安全 
性 可 参考 无 人 驾驶 技术 ， 从 完全 封闭 环境 下 的 无 人 参 
与 实验 环境 ， 到 实验 机 器 人 可 在 研究 人 员 参 与 的 实验 
环境 中 自主 安全 移动 ， 最 终 在 高 度 自治 的 基础 上 实现 
人 一 机 协作 共 融 。 


6 高 效 、 可 信 的 大 规模 科研 协作 


在 AI 驱动 科学 研究 的 新 范式 下 ， 大 规模 跨 领 域 的 
协作 已 成 为 科学 研究 的 必然 模式 。 智 能 化 科学 设施 支 
持 数 据 共享 ， 以 便于 AI 模 型 的 开发 与 测试 , 但 是 需要 
设计 一 系列 措施 对 数据 开发 者 的 知识 产权 与 利益 进行 
确认 与 保护 。 近 年 来 ， 去 中 心 化 科学 (Desci) 也 备 受 
科研 人 员 关 注 ，DeSci 旨 在 使 用 Web3 工具 ， 包 括 智能 
合约 和 区 块 链 来 解决 科学 研究 中 的 知识 产权 问题 ， 促 
进 科学 数据 的 共享 流通 。 在 智能 化 科学 设施 的 架构 
中 ， 区 块 链 技 术 为 打造 安全 、 可 信 的 协作 环境 提供 基 
础 ， 联 邦 学 习 技术 能 够 在 去 中 心 化 的 协作 环境 中 解决 
数据 孤岛 问题 并 保证 数据 安全 和 科研 效率 ， 互 联网 群 
体 智能 可 以 将 不 同 的 科研 模块 整合 在 统一 的 平台 中 ， 
实现 高 效 的 大 规模 科研 协作 。 


会 方法 方法 会 方法 会 


图 8 高 效 、 可 信 的 大 规模 科研 协作 系统 


Figure 8 Efficient, trustworthy, and large-scale research 


collaboration system 


(1) 基于 区 块 链 的 可 信 计 算 。 基 于 区 块 链 的 可 信 
计算 可 对 科研 协作 过 程 中 各 方 的 工作 和 贡献 进行 淹 
源 ， 实 现 科研 协作 多 方 确 权 。 区 块 链 和 AI 的 有 效 结合 
将 是 构建 可 信 的 科研 协作 环境 的 有 效 方法 。AI 技 术 可 
以 实现 区 块 链 的 可 预测 性 ， 并 有 效 检测 区 块 链 及 其 智 

合约 的 漏洞 ， 提 升 其 安全 性 。 反 之 ， 区 块 链 技术 有 
望 解决 AI 模型 的 分 布 式 数据 共享 和 分 布 式 训练 推理 等 
问题 。 

(2) 基于 联邦 学 习 的 科学 计算 。 联 邦 学 习 有 望 实 
现 数据 去 中 心 化 的 科学 计算 ,通过 相 容 激励 的 机 制 设 
计 ， 实 现 多 用 户 端 协作 的 机 器 学 习 模 型 训练 和 推理 。 
基于 联邦 学 习 的 科学 计算 只 要 求 用 户 将 数据 存储 在 本 
地 ， 不 需要 每 个 用 户 上 传 数据 ， 通 过 迭代 的 模型 聚合 
实现 学 习 目 标 ， 满 足 大 规模 科研 协作 的 科学 数据 及 模 
型 的 去 中 心 化 需求 。 

(3) 网 络 空间 中 的 群体 智能 。 综 合 运 用 数 联网 、 
群体 决策 、 语 言 大 模型 等 技术 ， 科 研 群体 有 望 在 网 
络 空间 形成 大 规模 的 科研 协作 ， 突 破 传统 科研 协作 
的 时 空 局 限 性 ， 为 科研 人 员 推 荐 相关 的 研究 团队 、 
连接 不 同 领域 的 科研 人 员 、 增 强 跨 学 科 科 研 协作 、 
实现 对 传统 科学 设施 的 AI 赋 能 。 其 关键 技术 可 以 概 
括 为 : CD 基于 数字 对 象 的 数 联网 。 数 联网 是 基于 互联 
网 的 虚拟 数据 网 络 ， 通 过 数字 对 象 有 效 连接 分 布 式 的 
数据 平台 ， 支 撑 多 元 异 构 科 学 数据 的 互通 互联 。 以 数 
字 对 象 为 核心 的 数 联网 为 构建 AI for Science 科研 协作 
平台 提供 了 有 效 载体 中 。@@ 群体 智能 决策 策略 。 网 络 
空间 中 的 人 类 与 机 器 之 间 共 同 协作 的 群体 智能 通过 
“探索 一 融合 一 反馈 ”机 制 忠 ， 有 望 促进 开源 社区 等 
协作 平台 的 决策 效率 。(@ 基于 语言 大 模型 的 智能 体 。 
ChatGPT 等 语言 大 模型 为 机 器 与 机 器 之 间 群 体 智能 科 
研 协作 提供 了 新 的 契机 。 由 于 语言 大 模型 拥有 知识 、 
推理 能 力 、 思 维 链 功 能 ， 使 得 其 可 以 作为 智能 体 ， 实 
现 复杂 协作 任务 中 的 自主 管理 和 调度 。 
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7 总 结 与 展望 


AI for Science 正在 成 为 驱动 科学 人 研究 的 新 范式 ， 
引起 各 国政 府 、 高 校 和 科研 机 构 的 高 度 重视 。 本 文 提 
出 了 建设 智能 化 科学 设施 的 构想 ， 阐 述 了 “ 算 力 支撑 
一 科学 引擎 一 无 人 实验 ”3 层 基 础 架构 和 “科学 大 模 
型 、 生 成 式 模拟 与 反 演 、 高 通 量 自主 无 人 实验 、 大 规 
模 可 信 协 作 ”4 个 创新 功能 ， 形 成 高 度数 字 化 和 智能 
化 的 新 型 智能 化 科学 设施 ， 同 时 对 已 有 的 重大 科学 设 
施 进 行 A[ 赋 能 。 

智能 化 科学 设施 的 建设 不 仅 有 助 于 解决 复杂 科学 
问题 、 促 进 跨 学 科 合 作 创 新 、 开 尽 新 的 科学 疆域 ， 而 
且 有 望 对 工程 技术 、 未 来 产业 起 到 重要 推动 作用 。 在 
工程 技术 方面 ， 智 能 化 科学 设施 可 以 提高 大 规模 和 复 
杂工 程 问题 的 仿真 和 推理 能 力 ， 对 复杂 工程 场景 做 出 
更 加 准确 的 预测 ， 提 高 重大 工程 设备 的 可 靠 性 和 运行 
效率 。 在 产业 方面 ， 智 能 化 科学 设施 的 建设 将 促进 我 
国产 业界 承接 基础 研究 的 新 成 果 ， 并 充分 利用 AI 和 区 
块 链 等 技术 ， 探 索 低 成 本 、 高 可 信 、 标 准 化 的 CRO 
(合同 研究 组 织 ) 科 创 合作 模式 及 其 “风险 共 担 、 收 
益 共 享 ”的 激励 机 制 ， 提 升 重大 科技 成 果 的 转化 效率 
和 质量 ， 对 未 来 产业 发 展 起 到 支撑 作用 。 


致谢 “” 圳 心 感谢 丁 奎 岭 院士 、 程 津 培 院士 对 本 文 的 
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AI for Science: AI enabled scientific facility transforms 


fundamental research 


YANG Xiaokang! XU Yanyan CHEN Lu" WANG Yunbo GAO Yue! TIAN Jidong' 
YU Kai" JIN Yaohui MEI Hong" 
(1 Artificial Intelligence Institute, Shanghai Jiao Tong University, Shanghai 200240, China; 
2 Department of Computer Science and Engineering, Shanghai Jiao Tong University, Shanghai 200240, China; 
3 School of Electronics Engineering and Computer Science, Peking University, Beijing 100871, China) 
Abstract In recent years, artificial intelligence (AI) has achieved numerous disruptive breakthroughs in frontier scientific and 
technological fields, such as AlphaFold2 for protein structure prediction, intelligent control of nuclear fusion, and drug design for 
COVID-19. These achievements indicate that AI for Science is becoming a new paradigm in research. To achieve fundamental 
scientific innovation and major technological breakthroughs in the era of intelligence, two core issues should be addressed: 1) how to 
harness the generality and creativity of the new-generation of AI, especially generative AI and large language models (LLMs), to 
promote the formation of new paradigms; 2) how to empower and transform traditional scientific facilities using AI. To tackle these 
challenges, this study proposes a concept of Al-enabled scientific facility (AISF) that caters to the requirements of both establishment 
of totally new intelligent scientific facility and AI empowerment of existing scientific facilities. It aims to construct an infrastructure 
system for AI for Science, enabling innovative functionalities such as scientific large language models (LLMs), generative simulation 
and inversion, autonomous intelligent unmanned experiments, and large-scale trustworthy scientific collaboration. These advancements 
will accelerate scientific discoveries, synthesis of transformative materials, and application of related engineering technologies. 
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